Objetivos de Aprendizagem
- Avaliar a eficiência do modelo de execução SIMT em cargas de trabalho paralelas
- Identificar gargalos de desempenho relacionados à divergência de ramificações e serialização
- Analizar técnicas de ocultação de latência de memória no escalonamento de warps
- Calcular métricas de utilização e ocupação para kernels de GPU